可变形的注册包括找到两个不同图像之间的最佳密集对应。许多算法已发表,但临床应用难以解决优化问题所需的高计算时间。通过利用GPU计算和学习过程,深入学习超越了这种限制。然而,许多深度学习方法不考虑经典算法尊重的理想性质。在本文中,我们呈现MICS,一种用于医学成像注册的新型深度学习算法。由于注册是一个不良问题,我们将我们的算法集中在不同性质的方面:逆一致性,对称性和方向节约。我们还将我们的算法与多步策略组合以改进和改进变形网格。虽然许多方法向脑MRI应用了登记,但我们探讨了更具挑战性的身体定位:腹部CT。最后,我们在Learn2Reg挑战期间使用的数据集中评估了我们的方法,允许与已发布的方法进行公平比较。
translated by 谷歌翻译
In this paper, we identify the best learning scenario to train a team of agents to compete against multiple possible strategies of opposing teams. We evaluate cooperative value-based methods in a mixed cooperative-competitive environment. We restrict ourselves to the case of a symmetric, partially observable, two-team Markov game. We selected three training methods based on the centralised training and decentralised execution (CTDE) paradigm: QMIX, MAVEN and QVMix. For each method, we considered three learning scenarios differentiated by the variety of team policies encountered during training. For our experiments, we modified the StarCraft Multi-Agent Challenge environment to create competitive environments where both teams could learn and compete simultaneously. Our results suggest that training against multiple evolving strategies achieves the best results when, for scoring their performances, teams are faced with several strategies.
translated by 谷歌翻译
Recent lay language generation systems have used Transformer models trained on a parallel corpus to increase health information accessibility. However, the applicability of these models is constrained by the limited size and topical breadth of available corpora. We introduce CELLS, the largest (63k pairs) and broadest-ranging (12 journals) parallel corpus for lay language generation. The abstract and the corresponding lay language summary are written by domain experts, assuring the quality of our dataset. Furthermore, qualitative evaluation of expert-authored plain language summaries has revealed background explanation as a key strategy to increase accessibility. Such explanation is challenging for neural models to generate because it goes beyond simplification by adding content absent from the source. We derive two specialized paired corpora from CELLS to address key challenges in lay language generation: generating background explanations and simplifying the original abstract. We adopt retrieval-augmented models as an intuitive fit for the task of background explanation generation, and show improvements in summary quality and simplicity while maintaining factual correctness. Taken together, this work presents the first comprehensive study of background explanation for lay language generation, paving the path for disseminating scientific knowledge to a broader audience. CELLS is publicly available at: https://github.com/LinguisticAnomalies/pls_retrieval.
translated by 谷歌翻译
对象之间的良好距离和相似性度量的选择对于许多机器学习方法很重要。因此,近年来已经开发了许多度量学习算法,主要用于欧几里得数据,以提高分类或聚类方法的性能。但是,由于难以在归因图之间建立可计算,高效和可区分的距离,尽管社区的浓厚兴趣,但很少开发适合图形的度量学习算法。在本文中,我们通过提出一个新的简单图表学习 - SGML-模型,该模型几乎没有基于简单的图形卷积神经网络-SGCN-和最佳传输理论元素。该模型使我们能够与标记(属性)图的数据库建立适当的距离,以提高简单分类算法(例如$ k $ -nn)的性能。可以快速训练这个距离,同时保持良好的表现,如本文中提出的实验研究所示。
translated by 谷歌翻译
深层网络的监督表示学习倾向于过度培养培训课程,而对新课程的概括是一个具有挑战性的问题。经常评估在同一培训课程的固定图像上学习的嵌入。但是,在实际应用中,数据来自新来源,新颖的类可能会出现。我们假设将新颖类的未标记图像以半监督的方式纳入训练,这将有助于与香草监督的表述相比,有效地检索新颖级别的图像。为了以一种综合的方式验证这一假设,我们提出了一种原始的评估方法,该方法可以通过随机或语义上的数据集类别进行分区,即通过对基础和新颖类之间的共享语义进行最小化,从而改变了新颖类的新颖性程度。该评估程序允许盲目训练一台新型级标签,并评估基础或新型阶级检索的冷冻表示。我们发现,香草的监督表现不足,因此在新颖阶级的检索中差不多,因此当语义差距更高时。半监督算法可以部分弥合这一性能差距,但仍然有很大的改进空间。
translated by 谷歌翻译
在Xu和Raginksy [1]引入的框架的基础上,我们研究了基于模型的贝叶斯强化学习问题的最佳实现性能。为此,我们将最小贝叶斯遗憾(MBR)定义为可通过从收集的数据学习或了解环境及其动态来获得的最大预期累积奖励之间的差异。我们将此定义专门用于强化学习问题,以模仿马尔可夫决策过程(MDPS),其内核参数是代理不明的,并且其不确定性由先前的分布表示。提出了一种推导MBR上上限的方法,并根据相对熵和Wasserstein距离进行特定边界。然后,我们专注于两种特定的MDP案例,即多臂强盗问题(MAB)和与部分反馈问题的在线优化。对于后一个问题,我们表明我们的界限可以从Russo和Van Roy [2]的当前信息理论界限以下恢复。
translated by 谷歌翻译
我们展示了深度学习模型,特别是像自然语言的变压器那样的架构,可以在随机生成的数据集上培训,以预测代谢网络的定性和定量特征非常高的准确性。使用标准数学技术,我们创建了可以用于训练我们的模型的大型随机网络的大集(40 00万个元素)。这些训练有素的模型可以在超过99%的情况下预测随机图的网络均衡。它们还可以概括与不同结构的图表,而不是在训练时遇到的图表。最后,他们可以预测一小组已知的生物网络的均衡。我们的方法在实验数据中非常经济,并且仅使用小而浅的深度学习模型,远离机器翻译中常用的大型架构。这种结果为更大利用深入学习模型的方法铺平了与定量系统药理学,系统生物学和合成生物学等重点领域相关的问题。
translated by 谷歌翻译
引入了涉及高斯流程(GPS)的模型,以同时处理多个功能数据的多任务学习,聚类和预测。该过程充当了功能数据的基于模型的聚类方法,也是对新任务进行后续预测的学习步骤。该模型是将多任务GPS与常见平均过程的混合物实例化。得出了一种用于处理超参数的优化以及超构件对潜在变量和过程的估计的优化。我们建立了明确的公式,用于将平均过程和潜在聚类变量整合到预测分布中,这是两个方面的不确定性。该分布定义为集群特异性GP预测的混合物,在处理组结构数据时,可以增强性能。该模型处理观察的不规则网格,并提供了关于协方差结构的不同假设,用于在任务之间共享其他信息。聚类和预测任务上的性能将通过各种模拟方案和真实数据集进行评估。总体算法称为magmaclust,可公开作为R包。
translated by 谷歌翻译
在本文中,我们考虑了多任务表示(MTR)的框架学习的目标是使用源任务来学习降低求解目标任务的样本复杂性的表示形式。我们首先回顾MTR理论的最新进展,并表明它们可以在此框架内进行分析时为流行的元学习算法提供新颖的见解。特别是,我们重点介绍了实践中基于梯度和基于度量的算法之间的根本差异,并提出了理论分析来解释它。最后,我们使用派生的见解来通过新的基于光谱的正则化项来提高元学习方法的性能,并通过对少量分类基准的实验研究确认其效率。据我们所知,这是将MTR理论的最新学习范围付诸实践的第一项贡献,以实现几乎没有射击分类的任务。
translated by 谷歌翻译
视觉定位通过使用查询图像和地图之间的对应分析来解决估计摄像机姿势的挑战。此任务是计算和数据密集型,这在彻底评估各种数据集上的方法攻击挑战。然而,为了进一步进一步前进,我们声称应该在覆盖广域品种的多个数据集上进行稳健的视觉定位算法。为了促进这一点,我们介绍了Kapture,一种新的,灵活,统一的数据格式和工具箱,用于视觉本地化和结构 - 来自运动(SFM)。它可以轻松使用不同的数据集以及有效和可重复使用的数据处理。为了证明这一点,我们提出了一种多功能管道,用于视觉本地化,促进使用不同的本地和全局特征,3D数据(例如深度图),非视觉传感器数据(例如IMU,GPS,WiFi)和各种处理算法。使用多种管道配置,我们在我们的实验中显示出Kapture的巨大功能性。此外,我们在八个公共数据集中评估我们的方法,在那里他们排名第一,并在其中许多上排名第一。为了促进未来的研究,我们在允许BSD许可证下释放本文中使用的代码,模型和本文中使用的所有数据集。 github.com/naver/kapture,github.com/naver/kapture-localization.
translated by 谷歌翻译